دسته بندی صفحات وب برای پالایش

thesis
abstract

مسئل? حفاظت از اقشار آسیب پذیر جامعه در مقابل موارد ناهنجار در صفحات وب، موجب احساس نیاز به پالایش صفحات وب شده است. یکی از جنبه های پالایش صفحات وب که امروزه بیش از پیش مورد توجه قرار گرفته است، طبقه بندی صفحات بر اساس میزان خشونت آمیز بودن آن ها است. طبقه بندی در واقع نسبت دادن یک صفحه به یک یا چند موضوع از پیش تعیین شده با استفاده از الگوهای آموزش داده شده می باشد. سیستم با استفاده از یک سری صفحات آموزشی که موضوع آن ها از قبل تعیین شده است، آموزش داده می شود تا بتواند اسناد جدید را به صورت صحیح طبقه بندی نماید. روش های مختلفی برای این کار وجود دارد که اغلب روش های آماری یا هوش مصنوعی می باشند. در این پایان نامه رویکرد همنشینی کلمات برای طبقه بندی صفحات وب فارسی پیشنهاد شده است. در واقع با استخراج میزان همنشینی کلمات خشونت آمیز با هم و با کلمات تعدیل کنند? خشونت ، متون فارسی به دو دسته خشونت آمیز و غیرخشونت آمیز طبقه بندی می شوند. به دلیل عدم وجود مجموع? داده استاندارد، صفحات وب به صورت دستی جمع آوری شده است. در روش ارائه شده، در فاز آموزش از 70 داد? آموزشی برچسب دار استفاده شده است. در این فاز با استفاده از داده ها، میزان همنشینی کلمات خشونت آمیز با هم و با کلمات تعدیل کنند? خشونت محاسبه شده و ماشین آماد? طبقه بندی صفحات جدید می شود. برای سنجش کیفیت کار نیز از 120 صفح? وب استفاده شده است و در نهایت الگوریتم طبقه بندی کننده توانسته است به دقت 175/97% دست پیدا کند.

First 15 pages

Signup for downloading 15 first pages

Already have an account?login

similar resources

ارائه روشی ترکیبی برای دسته بندی موضوعی صفحات وب به صورت خودکار

اهمیت دسته بندی موضوعی صفحات وب باعث شده با پیدایش اولین سایت های اینترنتی شرکت های بزرگی مانند یاهو و aol به فکر ارائه سرویس های فهرست وب که وب سایت های مختلف را با کمک نیروی انسانی بر اساس موضوع دسته بندی می کند بیفتند. با افزایش روز افزون تعداد صفحات وب و عدم امکان دسته بندی صفحات وب به صورت دستی و همچنین پیدایش کاربرد های دیگری برای دسته بندی خودکار صفحات وب از قبیل فیلترینگ هوشمند و ایجاد ...

دسته بندی صفحات وب با استفاده از الگوریتم های یادگئری ماشین و هوش محاسباتی

امروزه صفحات گسترده وب به بزرگ ترین منبع اطلاعات برای انسان تبدیل شده است. با افزایش تعداد کاربران وب و همچنین وب سایت ها، نیاز به دسته بندی صفحات وب روز به روز بیش تر احساس می شود. در این پایان نامه، ابتدا مجموعه داده مناسبی از چهار گروه از صفحات وب استخراج شده است. در ادامه از اطلاعات موجود در متن، ساختارو آدرس صفحات وب استفاده شده است. پس از پیش پردازش اطلاعات ورودی و حذف کلمات غیر مرتبط موج...

15 صفحه اول

استفاده از روش دسته بندی طیفی سلسله مراتبی در شبکه های قدرت تحت وب

سیستم انتقال برق را می توان با شبکه‎ای نشان داد که دارای گره و اتصالات می باشد که نشان دهنده شین ها و خطوط انتقال الکتریکی هستند. به هر خط می توان مقدار داد که نشان دهنده برخی از ویژگی های الکتریکی خط مثل ادمیتانس خط یا توان عبوری متوسط در زمان مشخص می باشد. از روش دسته‎بندی طیفی سلسله مراتبی برای آشکار سازی ساختار اتصالات داخلی یک شبکه استفاده می کنیم. دسته‎بندی طیفی از مقادیر و بردار های ویژه...

full text

رسانه، ابزاری برای دسته بندی نسلها در ایران

عوامل متفاوتی ابژه های یک نسل را ساخته و می توان از چنین شاخص هایی برای بررسی تغییرات و ایجاد تمایز در بین نسلها بهره برد. مطالعات انجام شده در حوزه نسلها را می توان به دو دسته کلان تقسیم نمود. مطالعاتی که به ترسیم ویژگی های یک نسل و یا نسلهای مختلف پرداخته اند و در پی تفسیر علل تفاوت کنش های اجتماعی در نسلهای مختلف بوده اند و دسته دیگر از بررسی ها، به مطالعه وضعیت روابط بین نسلها همت گمارده و ...

full text

تکوین معیارهای زیبایی‌شناسی صفحات وب ایران

چکیده بررسی زیبایی در محیط تعاملی وب به‌معنای توجه به مخاطب به‌مثابه‌ی دریافت‌کننده‌ای منفعل نیست بلکه به معنی نیاز به روشی برخط است تا بتوان مخاطب را در فرایند طراحی وارد نمود. هدف از پژوهش، پیشنهاد روشی برای اخذ بازخورد مخاطب و تحلیل نتایج به‌منظور دست‌یافتن به معیارهای زیبایی‌شناسی مخاطب‌محور است. روش تحقیق، توصیفی-تحلیلی، همراه مطالعات کتابخانه‌ای، پژوهش میدانی و مصاحبه است. جهت تحلیل داده...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}


document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده ریاضی

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023